03. 提问
提问
查看页面底部关于此葡萄酒质量数据集的详细信息,以完成下面的练习。
SOLUTION:
- 哪些化学特性在预测葡萄酒质量方面最为重要?
- 是否特定类型的葡萄酒(红葡萄酒或白葡萄酒)的品质更高?
- 酒精含量更高的葡萄酒是否获得的评价更高?
- 味道更甜(残糖更多)的葡萄酒是否获得的评价更高?
- 什么水平的酸度(pH 值)代表质量更高?
QUESTION:
你会如何回答这些问题中的每一个?你将使用此数据集的哪部分?
ANSWER:
你有办法以不同的方式修改或表示数据,以帮助回答此问题吗?
来自 UCI 机器学习实验室的葡萄酒质量数据集
共有两个数据集,提供了有关葡萄牙“青酒”的红葡萄酒和白葡萄酒变体的样本信息。每种样本都由专家做了质量评级,并进行了理化指标检验。由于隐私和物流问题,仅这些理化性质和质量评级的数据可用(例如,没有关于葡萄类型、葡萄酒品牌、葡萄酒销售价格等的数据)。 (来源)
每个数据集中的属性:
# | 理化性质 | 字段名称 |
---|---|---|
1 | 固定酸度 | fixed acidity |
2 | 挥发性酸度 | volatile acidity |
3 | 柠檬酸 | citric acid |
4 | 残糖 | residual sugar |
5 | 氯化物 | chlorides |
6 | 游离二氧化硫 | free sulfur dioxide |
7 | 总二氧化硫 | total sulfur dioxide |
8 | 密度 | density |
9 | pH 值 | pH |
10 | 硫酸盐 | sulphates |
11 | 酒精度 | alcohol |
# | 质量等级 | 字段名称 |
---|---|---|
12 | 质量 - 0 到 10 之间的得分(葡萄酒专家至少 3 次评估的中值) | quality |